探索数据集
代码功能性
Criteria | Meet Specification |
---|---|
代码是否正常运行? |
所有代码均有用且运行时不会产生错误。所给代码足够重现描述的结果。 |
项目是否适当使用了 NumPy 和 Pandas? |
项目在适当情况下使用 NumPy 数组和 Pandas Series
|
项目是否使用良好的编码实践? |
代码利用函数来避免重复代码。代码包含清晰的注释和变量名称,可读性较高。 代码的注释中并没有包含对于统计数字和可视化的推理说明。恰当地使用了Markdown格式。 |
分析质量
Criteria | Meet Specification |
---|---|
项目是否清楚地提出了问题? |
项目清楚地提出了一个或多个问题,然后在分析的其余部分解决了这些问题。 |
数据整理阶段
Criteria | Meet Specification |
---|---|
是否对数据清理进行了良好的记录? |
项目记录了为清理数据所做的所有变更,例如合并多个文件,处理丢失的值等。 |
探索阶段
Criteria | Meet Specification |
---|---|
是否采用多种方式探索数据? |
项目从多个角度调查所述问题。至少有三个变量使用单变量 (1d) 和多变量 (2d) 探索进行了调查。 |
是否存在多种相关可视化和统计汇总? |
项目采用了多种可视化并展示了多项对比和趋势。分析中在进行与数据有关的推理时都会计算相关统计。
|
结论阶段
Criteria | Meet Specification |
---|---|
学员是否正确表明了结论只是暂时的? |
分析结果在展示时明确说明了存在的任何限制。分析中没有涉及”因果性“的论述或暗示。 |
沟通阶段
Criteria | Meet Specification |
---|---|
分析流程是否容易理解? |
每个分析决策、图和统计汇总均提供了推理说明。 |
数据是否使用了适当的图和参数进行了可视化? |
项目的可视化采用适当的方式描述数据,所用的图容易解读,具有坐标轴标记、单位、图例、图标题。 |